Uber-Daten aus New York


Die Datensatz ist von Kaggle. Uber New York Data beschreibt Uber Daten in New York.

die Notwendige packete importieren

die Datein im ordner anzeigen lassen

Alle csv datein einlesen einzeln dann verketten in eine einzelne DataFrame

Ein copy aus der dataframe erstellen damit python nicht jedes mal die datein aus dem Ordner einliest

die erste 5 Elemente der Dataframe anzeigen

zahlen der zeilen und spalten der Dataframe anzeigen

die verschiene types der dataframe anzeigen

rechnen die summer der null stellen in der Dataframe pro spalte

mit hilfe von seaborn, die null stellen in eine Graphik darstellen

die spalte 'Date/time' zu datetime objekt umwandeln

daten type der Dataframe anzeigen

die erste 5 elemente anzeigen der Dataframe

date time objekt in tag wochen minute und stunde zerlegen (um die rechnung zu vereinfachen später)

die 5 zeilen der Dataframe anzeigen

daten type der neue Dataframe anzeigen

die einzelne Elemente der Spalte 'Base' anzeigen

die einzelne Elemente der Spalte 'day' anzeigen

die einzelne Elemente der Spalte 'weekday' anzeigen

In Welchen Wochen tag werden taxi am Meinsten benötigt

Dataframe gruppieren nach 'weekday' und zählen pro spalte

dictionary erzeugen mit wochentage als keys

neue Spalte erstellen die Wochentage zugewisene value nummer enthählt

Dataframe sortieren nach 'Day_id'

die spalte 'Base' anzeigen

Säulendiagramm : darstellung von zahl der fahrten pro wochentag

welche uhrzeit werden am meinsten taxi benötigt

die stunden tag zu x und zahl der fahrt pro stundent tag zu y zuweisen

Säulendiagramm : darstellung von zahl der fahrten pro stundentag

Anzahl der Fahrten pro stunden in jedes Monat

Dataframe monaten position anzeigen

in der 4ten monat zahl der fahrten in verschiedene Uhrzeiten

Seulendiagramm: zahl der fahrten pro stundentag in der 4ten monat

zahl der fahrten in verschiedene Uhrzeiten im monat April, August,July,juni,May und September

zu welche monat werden die meinsten fahrt benötigt

monat zahl mit monat string ubennen

Saulendiagramm: zahl der fahrten pro monat

Zahl der uber pro stunden Wochen tag

data frame nach 'weekday' und 'hour' gruppieren

Dataframe nach gruppierung Anzeigen

Dataframe pivotieren nach index weekday

Heatmap: heufigkeit verteilung der fahrten pro stunde in verchiedene wochentage

Uber Base Analyse

Dataframe gruppieren nach 'Base' und 'mounth'

Saulendiagramm : Zahl der fahrten pro 'Base' in verschiedene Monaten

Daten Auf der Karte Visualisieren

aus open street map ! die karte begrenzen

40.90366, -74.10665 unten recht

die gefilterte Dataframe anzeigen

zahl der gelöschte zeilen berechnen

image aus eine matrix erzeugen zum testen

Test: die position von eine geographische punkt (40.800,-73.95000) auf die erzeugene coordinaten system berechnen

die position von alle geographische punkte aus der Dataframe auf die erzeugene coordinaten system berechnen berechnen

data frame gruppieren nach 'Lon' und 'lat' und die heufigkeit pro (Lat,Lon) berechnen

ein bild erzeugen die standart mässig dunkel ist (Array aus dem nullen besteht)

bild arrays mit der heufigkeit verteilung von der Lon und Lan erzetsen

um das ergebniss bessere zu verstehen, heatmap wird mit der heufigkeit verteilung der geographische coordinaten erzeugt

heufigkeit verteilung der coordinaten system matrix als bild anzeigen

This is a heading